RDLY
.ru
Тренды
Статьи
Темы
Люди
LLM Reasoning
3 статьи
1ч 47м
🧠 DeepSeek R1 против OpenAI o1: как алгоритм GRPO изменил правила игры в ИИ
Stanford Online · 14.11.25 · 47,6 тыс. просм.
1ч 47м
🧠 Стэнфорд CME295: Как алгоритм GRPO и DeepSeek R1 изменили логику нейросетей
Stanford Online · 14.11.25 · 47,6 тыс. просм.
1ч 11м
🧠 Иман Мирзаде из Apple: «Мы строим самолёт, чтобы долететь до Луны»
Machine Learning Street Talk · 19.03.25 · 11,5 тыс. просм.